查看原文
其他

美女与IT兽音频 | 从人工智能到智慧未来,变现你做到了吗?

爱中小企业的 微软商业视角 2021-04-22

· 本文内容分为:图文+音频

· 主题:从智能到智慧,能落地变现的AI才是好场景+免费区块链直播课报名

· 收听/阅读时间:10分钟

· 阅读建议:拉着产品经理一起看/听

· 掌握难度:★★☆☆☆




节前发过一次,但神秘的消失了,怕没听到的IT兽“哇”的一声哭出来,所以今天我们再来一次!


再来一次还是说这个“俗气”的话题——人工智能到底怎么变现。(老话没解决就要继续说!)


怕错过?就赶紧戳开语音,吧~

*找彩蛋:语音中有一段话是主播用微软人工智能技术Custom Voice创建的!找到就在文末“写留言”,有奖励!


 ☟ 耳朵先行 ☟



-------- 文字版分割线 --------


大家好,我是美丽大方的Grace Peng。


今天的主题是《从智能到智慧 | 设计AI,迎合场景》。


我们讲智能讲了很多年,但讲智慧这个事情还都哆哆嗦嗦。别害羞,这是一个现状——大家刷标语的时候,机场打广告的时候......都说:我代表/引领/带领着智慧的未来,但是实际上你真正看到的智慧很难实现。


人工智能或大数据走下去继续发展都会面临一个赤裸裸的事实——





比方说无人机,原来基本就是一玩具,但现在无人机可以去做工业电力线的巡检;又比方说冰箱,很多冰箱也提出来一个口号:这不是冰箱,而是一个面板——它能告诉你里面放的是存储了几天的饭菜、缺了几个鸡蛋,然后你只要在冰箱的触摸屏上点一下下单,XX快递就自动上门!好有趣是不是?但是做起来是真的难难难难难!


以前管老师有一个系列主题演讲叫做物联网相对论,其中讲人工智能和物联网的时候讲到了智能单品,有一个烤箱的广告词是这样的:懒人必备烤箱,早上出门把食物放进烤箱,下班回家路上打开手机APP就可以开始烘烤甚至还可以选择用什么模式烹饪,回到家香喷喷的饭菜就出炉啦。但是比方说现在天气33度,早上放进去,等晚上回去,烤出来已经不知道是什么了,除非烤箱同时还具备电冰箱功能。那就不科学了。


智能,无论大数据还是人工智能,落地都需要有一个载体。这个载体至少有一半应该是跟物联网相关的,跟物相关的。跟物相关的时候,就有很多可以玩的空间。


这个玩的空间有两个含义。第一个含义是人工智能在落地的时候其实并不比人类懂的多,这有好处。而坏处在于正经想做一个产品,或做一个场景落地时,面对的未知的问题、未知的领域太多,这是第二个含义。


举个例子,智慧灯光,智慧办公室,这个话题不是第一天提出来的。微软有两家合作很深的小伙伴,一个是做智慧能源的ICONICS,另外一家是做办公器材的steelcase。做出来的办公室Hi漂亮,使用到各种物联网和人工智能技术,灯光也非常美,在这样的办公室舒服到不想下班!



    但这,是卖家秀。


我们来看一个买家秀:



一个办公室做了一个玻璃电话亭,刷卡就可以进。但进去之后就受不了了,抬头一看,灯特别亮!需要这么多led光使劲照么,会长高么?!然后更痛苦的事情发生了,它用了运动传感器,每五分钟如果发现里面没有动静了,灯就会关掉。这确实节能,但是我在里面工作啊,我就坐了五分钟,灯就熄了,这怎么搞啊。



发完一个同学就说这不算什么。我们在学校里面的厕所更变态。进去之后,一分钟发现没有声音就关灯。所以说我得一边蹲,一边拍手,好像在给自己鼓掌。这很不科学。


智能到智慧,任重而道远啊!


过去几年,我们一直在强调要找到智能与智慧之间的平衡点。总结下来其实就四件事:一、人,必须放在第一位;第二叫做感知技术,人工智能里有很多感知技术,这些技术成熟吗?他不见得敢说;第三是算法,有些地方你需要自己去定一些规则,比如到底是30秒就关灯还是不关灯,怎么去弄清这个算法?第四,就是数据反馈。

举个例子,这张照片是广州火车站二楼出发平台。



有很多验票闸机,但奇怪的是,人工验票的地方要排好长的队,但是人脸识别闸机的一侧不用排队,却没人去。

这是因为取票的地方在站内,进站就要先过闸机,但是人脸闸机又要求票证合一,把票放到检票口里,它才能进行人脸识别,这不是闹着玩儿吗?

 

两个月前再来这里,改成不用票证合一,只要身份证就可以了。但是奇怪,依然没有人去走人脸识别闸机,大家还是习惯走人工通道。

 

接下来,我们举第二个例子:是我们一个小伙伴做的SENCITY的例子——智能灯光,把灯光体装在垃圾桶上。




我们来看一看,如果有垃圾丢进这种垃圾桶,就给你“叮”一声,这样趣味性就来了——原来很多人扔垃圾不自觉,不扔进桶里,但是现在旁边就算没有垃圾,我都想去找点垃圾来扔,“叮”上一“叮”。


原来清洁工很辛苦,随时都在处理人们乱扔的垃圾,现在大家都喜欢往会发出声音的垃圾桶里丢垃圾了!但你说它耗不耗电?当然耗。但它做到了另外一件事——自我增值。上图这个发光垃圾桶上你可以看到桶身上个Microsoft,因为这一个是放在微软办公室里的,要是放到其他地方就是个发光广告牌。公交地铁站可以打广告,垃圾桶自然也可以!

这后面是IoT技术,这些垃(设)圾(备)桶在云端连接,想换什么内容显示就换什么。这是什么?这就是人!文!从人们真实需求出发设计的产品。


我们接着说第二件事情——感知。



举个微软自己的例子。在微软云Microsoft Azure上,已经有28项人工智能服务,每一项拿出来都是所谓独角兽的能力吧:



计算机视觉、语音相关的、语言相关的、知识相关的、搜索相关的......可以干的事情非常多,单个能力非常强,强到什么程度?



2016年微软的人工智能已经在物品识别这件事上超过了人的能力;2017年,语言识别超过人类;2018年阅读理解能力超过人类;就今年3月份,翻译能力又超过人类!


然后微软还推出了一个新服务叫Custom Voice——用少量的数据来创建一个语音。比如,刚刚其实有一段话我是用我自己的Custom Voice电脑合成播出的,你发现了吗?


这就是微软正在干的事情,不仅自己把技术开发出来,还要把他们开放出来!


很早以前有个IT兽就说,小冰这么牛,你能不能给我把这个Custom Voice的能力开放出来?我们说你要干嘛,他说我们要做一个智能骨灰盒,把亲人的声音先读出来,亲人去世后,这个骨灰盒就可以变成一个逝者声音的载体。并且如果微软还可以把人的行为模式和情绪模式也识别出来的话,那你就可以做到和一个差不多真实的人对话了!


几年前我们做不到,现在就已经在开放的路上了,并且前面说的情绪识别、行为模式识别啊什么的也都已经在路上了。


这些就叫感知能力。并且,用起来这些能力来也不复杂!其实它是就是个RESTful API,你只要给我一张照片,它就能识别出来这个人,以及他的情绪是什么样,这个confidence是多少,这个自信度是多少......全部都能显示出来。



用起来很简单,但我们还是要具象地去看一下,人工智能有它擅长的,却不是所有方面都牛掰。甚至有人担心人工智能很快就会取代人类,只能说想太多!


AI擅长的第一个叫做理解,第二是推理,第三个为自然交互。


- 理解,就是你给我一张图片,或者给我一个声音,我去理解“你到底在干什么”,或者“你想干什么?”;


- 推理,比方说你是医生,你要告诉我你诊断病人时的推理模式是什么,你告诉我的多了,我就开始学习你的模式;


- 自然交互,我可以跟人在实际或虚拟的环境当中模拟自然情况去交互。



再说说——




比如想了解孩子在学校的状态。那么只要取得孩子在班里的照片或视频,我就可以知道他当时在想什么,如果配上老师正在讲的内容,就知道孩子到底是懂还是没懂。


但单个图片去理解其实不对的。比如上图这个孩子,这个表情你说他是懂还是没懂?不知道。为什么,因为下一个动作,下一个他的情绪的表达其实决定了他到底是懂了还是没懂,他这个动作之后,如果“噢”,就是懂了,如果“诶”,就是没懂。



所以感知需要的是一个情绪认知的组合,把他场景化——这个孩子到底是听懂了还是在思考,是领悟了还是在走神?他需要把单项技术组合起来,我们来看另一个例子,怎么组合感知的能力?



上图是现在原型机雏形,全球只有200台。微软深圳做了一个叫黑塔,放在会议室。


这个盒子里面装了组合的技术:


第一是面部识别:识别是不是同一个人;


第二是语言、语音的识别:他会问你“要不要开始会议?”你说“开始”后,所有人讲的内容就会自动记录下来;


第三,这中间有一个很有意思的话题,Dave这个人在说话的时候,另外一个妹子打断了他,他不是一个单向的收音,有可能是双音甚至到了五音的,就是他被打断的时候可以识别现在说话的人是谁,并把它记录在里面;


第四,当它发现会议中有待办事宜的时候,它会take notes,把待办事宜记录下来;


第五,你可以跨国开这个会,把不在现场的国外的同事拉进来后,不仅语言可以被记录,同时还可以直接翻译成相应的语言。


以上,就是这个是盒子干的事情!着急要链接了?要下单了?现在没有正式版的,现在他还被叫做黑塔。


这个产品为什么只是做了一个demo就这么热?因为这个东西确实符合非常多用户的真实需求。




我们最近发现了一篇论文——(看上图)没有人的时候WiFi信号长上面这样,有人的时候信号是下面这样,这中间有什么区别?


于是就去做场景训练,用大量的数据灌到机器学习的深度学习框架里:有人、没人、有人没动、有人动、有人摔倒、没人摔倒、有人在这个位置摔倒、或者在那个位置摔倒......不同情况对WiFi信号有些什么影响? 


算完之后发现:诶?!真的有规律耶。于是就用WiFi代替了摄像头来去做全屋的人体识别。大概下个月,他们的WiFi模组就会出货,意思是只要你家里有任何灯,只要连了它的WiFi,用他的WiFi模组就能帮你在更好的隐私保护情况下来去运用这种人工智能或者数据。


说了这么多,要说到第三件大事情——



这个年代,基本你在任何地方都可能听到这个词。我举个微软的索罗马的例子来讲。



索罗马在干什么?


他主要是做垂直农业,大家可能知道作物不一定要在田里种,也可以放在屋子里种。在屋子里种田的好处在于我没有土,我可以叠起来好多层,占地就小;然后用LED灯去照模拟阳光,或者说加速阳光,让作物三倍速度成长,成熟就快。


当然了,这个技术还处于很前期的研究当中,不是那么快就能出成果的。原因在于LED的能耗其实挺高,而且有很多主食种不出来,比方说小麦、水稻就种不出来,玉米不太能种出来,西红柿之类的蔬菜比较容易。


这里面有个很有意思的事情,灯光在照射作物时,有一个太阳模式、两个太阳模式、三个太阳模式,种出来的菜口感和营养成分是不一样的。这时候就需要算法了,到底什么样的菜该用几个太阳的模式?得出来的口味是什么?适合什么样的人去吃?

 

再接下来比如足球,我们经常看到类似的场景——某球员使劲在人家门前踢来踢去就是不进球,当然也有非常精准的进球,像C罗那样。



好吧其实我是在用足球的例子讲医疗领域的事情,晃来晃去就是进不了球相当于医疗中的传统经验性处方药物不断试错,一记精准的绝杀球相当于现在和将来的个性化处方药物之精准诊疗。


现在和未来的精准诊疗,是辉瑞一个副总裁在微软AI大会上的分享——讲的是把数据结构化,之后去做数据集构建,做模型。



都说相似患者分析是大数据,对吧?道理大家都懂,本质是去找最佳路径。


病人做完检查,你把别的医院数据拿过来,和这个病人的数据加到一块,变成他的一个单独性数据。然后到这里面去看,说你这样的病人,最佳治疗路径可能有1、2、3条,第一条死亡率90%,第二条83%,第三条70%,我觉得可以选择70%的!



所以算法和数据是给医生一组最佳建议来做选择,但你医生这次治疗之后要去跟踪结果,然后再去把结果反馈回来。


但医疗中往往是很融合的场景,比如病人经常会问:医生,你说我现在能不能吃肥肉,我今天查出来高血脂但没什么感觉,请问我能喝酒吗?医生当然会说你不要喝酒,对吧?这是很正常的一件事情。


但病人就喜欢问这些问题啊,医生只能根据他原来的病例告诉他,你现在是什么情况,应该干什么不干什么。


那么这些重复问题丢给在线对话机器人怎么样?病人说一句话,机器人在后台找到了,就把反馈丢给你。很高效对不对?但怎么保证机器人可以识别出病人问句里的情绪?保证让这个本来就不太开心的病人不会变的更绝望?


这个问题,一开始就要解决!当对方提出问题时就要更精准的去理解他在说什么,这样才有企业或机构采购这个机器人,才会有数据不断去reward算法,做模型。这才叫智慧,智能才能真正变现!

 

再进一步讲实体机器人,要碰到的问题更多了。像医院的环境乌泱乌泱的人,你不仅要懂人工智能,要懂这个机器人能不能走,还要懂机器人怎么做情绪的反应,懂生产、懂降噪......这个事情就变很复杂了。



这个时候必须想办法,去做好人工智能的设计。



这个人工智能的设计其实不简单,比如有很多小伙伴找到微软,要用可以翻译66种语言的微软翻译技术去做翻译机。


拿微软AI大会上PK的两家翻译机举例,魔芋AI翻译机&魔脑伴侣翻译机。这两家公司其实都碰到过很多奇怪的问题,你不要以为做翻译机器人很简单——不就是做个外壳,做一个声音设备吗?一开始大家都是这么想的,微软也是这么想的,但是实际做起来的时候发现:没人搞的清楚降噪降到什么程度对翻译的语言识别最好。


因为对降噪没有理解,就不知道其实降噪太好识别率反而会降低;但是降噪不好识别率肯定也会降低......那么到底降噪到多少是最好?没有一个官方值,所以大家还要摸索。这个时候降噪多少就是人工智能的设计。



再举个例子,儿童陪护机器人。很多人都觉得这是刚需,但你真的去看市面上的儿童陪护机器人的时候,其实特别不智能。


因为现在的人工智能训练基本都是用成人的声音来去训练陪护机器人,小孩子的发音的频率和部位跟成人是不一样。因此小孩子说的同样一句话和大人说的对一个人工智能来讲完全是两句话。


最后我们来总结一下(要背啊朋友们):


1.微软可以提供单个能力很牛的工具和基本算法训练,你要做的是把这些能力组合设计成自己的产品或服务;


2.人工智能在产品设计上很不容易,但只要记住四件重要的事情就不会和真实场景差太远—— ① 人文:要靠智慧,而不是靠智能,人永远在考虑的首位;② 感知技术:有可能是传感器,有可能是像人工智能的展示技术;③ 算法:自己的规则用适合自己的数据集来算;④ 集成的能力


好,我今天要跟大家分享内容就到这里,下一个主题提前剧透:边缘的力量。我们会在下一期【美女与IT兽】音频节目讲在技术领域里越来越火的边缘计算以及我们对边缘计算的看法哦。


------ 我是为你整合“不宜错过”的分割线------


一、9大微软兴趣专家群,还没进的.....我等你好久啦!


二、近期《美女与IT兽》视频学习资源,戳对应图片立即获取:


三、  戳蓝字回顾『美女与IT兽』前22期(17期音频节目+5期视频节目):

NO.1 如果能说句话、挥挥手就能把事情办了,我们为什么还要做App?

NO.2 人类想象力的极限在哪里?

NO.3 物联网,千万别从头做起!

NO.4 别光想着双12了,Hololens这次真要来了!

NO.5 人工智能识别,已经走到哪一步了?

NO.6 你可能没发现,这么搭建云服务性价比更高!

NO.7 微软拥抱开源,你怎么玩?

NO.8 开发与运维,除了相杀也可以相爱!

NO.9 深度学习框架怎么选?选快的!

NO.10 30分钟做出一个智能音箱,一起吗?

NO.11 汽车那么多,产生的上亿车联网访问数据怎么玩儿?

NO.12 用微软人工智能,你到底能做啥?

NO.13 工业物联绝不是轻轻松松、敲锣打鼓就能实现的!

NO.14 让我们正经地谈一下工业物联的实现

NO.15 升级工业4.0,你可以比别人少花60%时间

NO.16 互联网科技金融平台,选云也要货比三家 

NO.17 翻译准确率提升50%,这家翻译机靠的是AI 

NO.18 智能硬件DIY平台如何一年时间快速的拓展近70国家? 

NO.19 当IT人讨论“区块链”的时候,都在说些什么?(上)

NO.20 你真的需要区块链吗?(下)

NO.21 各行业中领先出海的企业,都有一个共同点...

NO.22 NEO:如何用区块链实现“智能经济”分布式网络?


『美女与IT兽』是什么?  

① 美女:已经这么直白的上了“真相”就不用多说什么了~

② IT兽:对,就是你们!一直走在探索科技、新鲜事物的路上,不知不觉中影响着时代的一群人!


❀ 栏目形式:每期10分钟美女语音 & 图文内容


 栏目主题:这个时代有人工智能,有机器人,互联网发展到物联网。而这一切的基础,是“云”!


· 你的云要讲性价比,如何选择基础架构?

· 你的设备要相连,如何玩转物联网?

· 你的产品要升级,如何加入人工智能属性?

· 你的公司要加速,如何在云上加快效率?

......


如果你正在寻找以上问题的答案,那就守着这个“赏心悦耳”的栏目——听微软“非著名”主播聊云、聊科技。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存